时政
财经
科技
登录
#Group mean
关注
Go
5个月前
Haha, deepseek r1 is using a modified BoN-RL replacing BoN with Group mean advantage was. And Kimi is taking the formulation of BoN it self. Amazing to see those model become life
#文章信息提取
#人工智能
#深度学习
#机器学习
#BoN-RL
#Group mean
#模型
#技术讨论
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞